Apache Hadoop

Apache Hadoop hay Hadoop là một software framework hỗ trợ các ứng dụng phân tán dữ liệu chuyên sâu theo một giấy phép miễn phí. Nó cho phép các ứng dụng làm việc với hàng ngàn máy tính tính toán độc lập và petabyte dữ liệu. Hadoop được bắt nguồn từ các bài báo MapReduce của Google và Google File System (GFS).Hadoop là một trong những dự án hàng đầu của Apache, được xây dựng và được sử dụng bởi một cộng đồng những người đóng góp toàn cầu, viết bằng ngôn ngữ lập trình Java. Yahoo! đã đóng góp lớn nhất cho dự án, và Hadoop được sử dụng rộng rãi trên khắp các doanh nghiệp.

Tài liệu tham khảo

WikiPedia: Apache Hadoop http://apiwave.com/java/api/org.apache.hadoop http://research.google.com/archive/gfs.html http://research.google.com/archive/mapreduce.html http://www.nytimes.com/2009/03/17/technology/busin... http://ee380.stanford.edu/cgi-bin/videologger.php?... http://www.stanford.edu/class/ee380/Abstracts/1111... http://d-nb.info/gnd/1022420135 http://www.se-radio.net/2010/03/episode-157-hadoop... http://hadoop.apache.org/ https://intellipaat.com/blog/hadoop-creator-goes-t...